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Дослідження навчання компактних нечітких 
баз знань типу Мамдані 


У статті досліджується процес ідентифікації багатофакторних залежностей за допомогою нечітких баз 
знань типу Мамдані. В роботі представлені результати експериментів із визначення залежності помилки 
навчання компактних нечітких баз знань типу Мамдані від їх повноти. Експерименти проведено для 
залежностей «2 входи - 1 вихід». Запропонована експоненційна модель оцінки помилки навчання від 
повноти бази знань. 


Вступ 


Нечіткою базою знань називається сукупність нечітких правил «Якщо - тоді», 
яка задає взаємозв'язок між входами та виходами досліджуваного об'єкта. Незважаючи 
на велику кількість успішних застосувань нечітких баз знань в різних сферах | 1-41, 
деякі теоретичні та практичні питання їх проектування залишились відкритими. Серед 
них такі питання структурної ідентифікації, як вибір кількості нечітких термів, виду 
функцій належності, обсягу бази знань тощо. 

Проектувальники нечітких систем прагнуть створити адекватну нечітку базу 
знань найменшої складності - з малим числом правил та функцій належності. Таку ком- 
пактну модель легше верифікувати; вона забезпечує найбільшу швидкість логічного 
виведення та потребує найменше ресурсів за апаратної реалізації. В наших роботах (5), 6) 
експериментально встановлено, що за адекватного експертного проектування нечітких 
правил спостерігається квадратична залежність точності від рівня заповнення бази 
знань правила. Причому найточніші нечіткі моделі отримано для баз знань, що напов- 
нені правилами приблизно на 8090. У статті |6| встановлено, що для трьох тестових 
нелінійних залежностей «2 входи - І вихід» після навчання точність вдало спроектованої 
синглтонної нечіткої бази знань експоненційно залежить від її розмірності. Серед цих 
баз знань є достатні компактні - з трьох-чотирьох нечітких правил, які забезпечують доб- 
рий баланс між складністю навчання, тривалістю оптимізації та точністю ідентифікації. 

Метою статті є дослідження залежності впливу складності нечіткої бази знань 
Мамдані на точність навчання за експериментальними даними. Виявлення такої залеж- 
ності дозволить сформувати рекомендації з проектування адекватних компактних 
нечітких баз знань. Стаття є продовженням досліджень з робіт (5, 161. 


Постановка задачі 
Вважатимемо відомою тестову вибірку з М пар експериментальних даних, що 
пов'язують фактори впливу Ха (бно з виходом у досліджуваної 
залежності: 
(Х, у) геім, (1) 
де | Х, -вхідний вектор в г-му рядку вибірки та у, - відповідний вихід. 
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Позначимо через у - К(М,Р, Х) - модель на основі нечіткої бази знань Мамдані 
з М нечітких правил, що пов'язують Х з у,а через Р - вектор параметрів нечіткої 


бази знань, що налаштовуються. Згідно з |3| задача навчання нечіткої бази знань 
зводиться до знаходження таких параметрів Р, які забезпечать найменшу нев'язку 
на вибірці (1): 


ЕМУЕ - |. У», - Е(М, Р,Х,)) -зтіп. (2) 


те М 


Задачею дослідження є отримання залежності нев'язки ЕМУЕ після навчання 
відобсягу М нечіткої бази знань. За фіксованого нечіткого розбиття вхідних та вихідної 
змінних можна згенерувати кілька нечітких баз знань з одним і тим самим числом 
правил ( М ). Серед цих нечітких баз одного обсягу для навчання оберемо одну з най- 
меншим значенням КМУЕ . Як і в статті |6), криві навчання побудуємо за резуль- 
татами комп'ютерних експериментів з ідентифікації трьох залежностей з двома 
входами та одним виходом. Ідентифікацію проведемо на основі нечітких баз знань 
Мамдані з різною потужністю терм-множин вхідних та вихідної змінних. 


Нечітке виведення за базою знань Мамдані 


Нечітку базу знань Мамдані запишемо таким чином (|З: 
Якщо (ху зд; та х, зд; тата Х, а) з вагою уї;, 

тоді уз З, ; 
де а, - нечіткий терм, яким оцінено фактор х, в)-му правилі, і- І,п, / - 1,М; 


р 


а, - консеквент )-го правила, який задано нечітким термом; 


у», Є|0;)) - вага |-го правила, яка відповідає впевненості експерта в його достовірності. 
Ступінь належності поточного вхідного вектора Х - (е А ФОРА х)) до вихідних 
термів Фофозьсі. розраховують так: 
ша СХ") али (хи (бно б) зу з М, 
де й, (х/ ) - ступінь належності вхідного значення х; нечіткому терму ад: 


Результатом виведення за )-им правилом бази знань буде нечітка множина: 


й; з ітр (,, ш, СХ), і-1М, 


/ 


де шар позначає імплікацію, яку реалізують операцією мінімуму. 
Результат виведення за усіма правилами знаходять агрегуванням нечітких мно- 


ж соро Ож С ж ДК є 2, 
жин у - а?о (4, а,,.. 4, |, знаходячи максимум функцій належності. Чітке значення 
на виході моделі розраховують через дефазифікацію нечіткої множини у "за методом 
центра тяжіння |31. 


Навчання нечіткої бази знань Мамдані 


Відповідно до принципу зовнішнього доповнення | 7) навчання за експери- 
ментальними даними полягає в синтезі моделей-кандидатів за мінімумом КМУ5Е на 


922 «Искусственньй интеллект» 472011 


Дослідження навчання компактних нечітких баз знань типу Мамдані 


8Ш 


навчальній вибірці, з подальшим вибором серед них моделі з найменшою нев'язкою 
на тестовій вибірці. 
Нечіткі множини в базі знань задамо гаусовою функцією належності: 


бабучвір «ан 3) 
С 


де Б - ядро нечіткої множини а зміної х; 

с»0 - коефіцієнт концентрації. 

Відповідно до ідей збереження прозорості нечітких моделей з робіт |31, |8|, 
вектор Р для задачі (2) сформуємо з ваг правил, коефіцієнтів концентрацій функцій 
належності усіх термів та ядер нечітких множин некрайніх термів. Для нечіткої бази 
знань із М правил кількість параметрів для налаштування дорівнюватиме: 


ІР а М ОТ, - 2)- У СТ, - 2), (4) 
ї«І, п 
де Т, - потужність терм-множин вхідної змінної Х;, і- 1,п; 
Т, - потужність терм-множин вихідної змінної У. 
Для запобігання ефекту звуження вихідного діапазону через дефазифікацію за 
центром тяжіння розширимо носій нечітких термів змінної у відповідно до рекомендацій 
з (81. Для збереження лінійної упорядкованість терм-множини та забезпечення суттєвої 


відмінності сусідніх нечітких множин на параметри функцій належності накладемо 
ряд обмежень. Ці обмеження наведемо нижче, на прикладі змінної х, Т термів якої зада- 


но гаусовими функціями належності (3) з параметрами (6, Я Що ра а НО 1» Ро ) З 


р.а 


Рнх 


р 12я 


Ь, є)х І, /-1Т 5 (5) 
с; ре / Др й ВУ й 
й 5, єЇхух 1, теп Б, «5, «Б 


і21(Т-Ф 


іч? 


де |х; х | - діапазон можливих значень змінної Х; 


фас Абу б . 
5, Я точки перетину двох сусідніх термів. 
пери о ох 


і-1 
Перші дві умови (5) визначають, що ядра крайніх термів фФ,,ф, чітко закріплені 


за межами значень змінної. Третя умова вказує, що ядра Б, функцій належності (3) 


нечітких термів лежать в межах значень змінної |х;х |. Четверта умова обмежує коефі- 
цієнт концентрації додатними значеннями. П'ята умова означає, що точки перетину 
5; двох сусідніх термів повинні лежати між ядрами відповідних термів, або за межами 
значення змінної, дана умова зберігає впорядкованість термів. 

Налаштування параметрів нечіткої моделі здійснимо за квазін'ютонівським 
методом Бройдена - Флетчера - Гольдфарба -- Шанно |91, який апроксимує матрицю 
Гессе на основі множників Лагранжа. 
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Комп'ютерні експерименти 


Як і в |6) експерименти проведемо для 3 еталонних залежностей (рис. 1) -- нес- 
падної, унімодальної та багатоекстремальної: 


рез АТ 22221 зе МТ, (6) 
фо о о 35 61:31 я Є|9591 (7) 
у з(жвіо(х, )/)7, х, є |0; 51, х, 0.5; 2). (8) 


в) 


Рисунок І - Еталонні залежності: а) неспадна (6); б) унімодальна (7); 
в) багатоекстремальна (8) 


Нечітке моделювання здійснено в середовищі МАТІ. АВ з використанням пакета 
Ки7гу 1 обіс Тооїібох. Нечітке розбиття діапазону вхідних змінних здійснено за допо- 
могою гаусових функцій належності (3), ядра яких рівномірно розподілено на області виз- 
начення. Коефіцієнт концентрації функцій належності прийнято рівним с- Дсоге/24, 
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де Дсоге - відстань між ядрами сусідніх термів. За такого розподілу висота перетину 
нечітких множин сусідніх термів дорівнює 0,5. Консеквент кожного правила приймався 
за найбільшим степенем належності розрахованого значення за формулами (б) - (8) 
для ядер нечітких термів. 

Для кожного нечіткого розбиття експерименти проведено за такою схемою: 

1) згенерувати навчальну та тестову вибірку з 100 та 31 точок відповідно; 

2) згенерувати повний список з М, , адекватних нечітких правил з навчальної 


г 
вибірки; 


3) синтезувати усі можливі нечіткі бази з М правил, У - І, М 


тах ? 
4) для кожної нечіткої бази знань розрахувати нев'язку на тестовій вибірці за 
формулою (2); 
5) для кожної множини нечітких баз знань одного розміру знайти мінімальну 
КМУЕ, 


тіп 2 

6) провести навчання за квазіньютонівським методом з нелінійними обмежен- 
нями (5) на навчальній вибірці; 

7) для кожної навченої нечіткої бази знань розрахувати нев'язку на тестовій 
вибірці за формулою (2), побудувати графік залежності КМУ5Е від М. 

Для неспадної залежності (6) для оцінки вхідних змінних використовувалось 2, 
3 та 4 терми, тобто експерименти проведено для таких 9 нечітких розбиттів вхідних 
змінних: 2х2, 2х3, 2х4, 3х2, 3х3, 3х4, 4х2, 4х3 та 4х4. Відповідно, максимальна 
) склала 4, 6, 8, 6, 9, 12, 8, 12 та 16. Таким 


чином, протягом одного експерименту перевірено від 2. - 1-15 до 2". -1- 65535 
нечітких баз знань, з яких для подальшого навчання відібрано 4 - 64 -846-Ч94 12 
58-12 4 16 - 81. Для унімодальної залежності (7) застосовано нечіткі розбиття 
вхідних змінних 3х3, 3х4, 3х5, 4х3, 4х4 та 5х3, а для багатоекстремальної залежності 
(8) - нечіткі розбиття 4х2, 4х3, 4х4, 5х2 та 5х3. 

Відібрані найкращі бази знань з 1..МУ,,, правил настроєно з урахуванням обме- 


г 


кількість адекватних нечітких правил ( У 


тах 


жень (5) за допомогою пакета Орійтігацоп Тооїбох системи МАТІ АВ. Еексперименти 
показали (рис. 2), що після навчання нев'язка КМУ5Е спадає зі збільшенням кількості 
нечітких правил, але її мінімум в багатьох випадках досягається за неповної бази 
знань. На кривих навчання добре простежується «плато насичення», коли додавання 
нових правил майже не змінює адекватність нечіткої моделі після навчання. Як 
приклад, на рис. 3 наведено компактні нечіткі бази знань з 4 правил, які за ЕМУ5Е 
майже не поступаються найточнішим моделям з 8 - 16 правил. 

Зведемо результати усіх експериментів до одного масштабу (рис. 4). Для цього 
для кожної бази знань розрахуємо відносне відхилення її нев'язки від нев'язки 
найкращої бази знань. Позначимо цю величину через ЛАКМУЕ . На рис. 4 ромбами 
виділено результати найкращого навчання для баз знань з однаковою кількістю 
правил. Експоненційні апроксимації експериментальних даних за результатами най- 
кращого навчання показують, що плато насичення починається при наповненості 
бази знань правилами на 30 - 4090. На рис. 5 представлена залежність помилки іден- 
тифікації від кількості параметрів, що налаштовуються. Встановлено, що достатньо 
не більше 20 - 25 параметрів, щоб отримати адекватну та компактну нечітку базу 
знань Мамдані, що за (5) відповідає чотирьом правилам за нечіткого розбиття 3х3, 3х4, 
4х3, 5х3, 3х5 або 4х4. 
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Рисунок 2 - Криві навчання найкращих баз знань: а) залежності (6); 
6) залежності (7); в) залежності (3) 
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База знань про залежність (6) 


Скорочені назви термів: 
Д.Н. - дуже низький 

Н. - низький 

С. - середній 

В. - високий 

Д.В. - дуже високий 


дуже низький | низький | середній | високий 


База знань про залежність (7) 


База знань про залежність (8) 


Рисунок 3 - Компактні нечіткі бази знань після навчання 
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Висновки 


Експериментально встановлено, що компактну базу знань Мамдані з достатньо 
малою похибкою ідентифікації можна отримати при наповненості бази знань на 30 - 
4090, після чого збільшення кількості правил істотного не зменшує нев'язку. На нашу 
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думку, це обумовлено: 1) ускладненням задачі оптимізації через збільшення кількості 
керованих параметрів та 2) збільшенням взаємодії між правилами на їх границях. 
Встановлено, що після навчання залежність точності вдало спроектованої нечіткої 
бази знань від її розмірності може бути описана експоненційною залежністю. Для 
трьох досліджених залежностей прийнятними можуть бути обрані бази знань з чоти- 
рьох нечітких правил, які забезпечують баланс між складністю навчання, тривалістю 
оптимізації та точністю ідентифікації. Виявлена експоненційна залежність дозволяє 
наближено відтворити залежність помилки навчання від кількості правил за резуль- 
татами ідентифікації на основі всього 3 баз знань, наприклад, з наповненням в 7097, 
3090 та 1090. Подальші дослідження будуть спрямовані на підтвердження отриманих 
експериментальних висновків під час вирішення реальних задач ідентифікації. 
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С.Д. Штовба, В.В. Мазуренко 

Исследование обучения компактньтх нечетких баз знаний типа Мамдани 

В статье исследуєтся процесс идентификациий многофакторньтх зависимостей с помощью нечетких баз 
знаний типа Мамдани. В работе представлень результатьт зкспериментов по определению зависимости 
ошибки обучения компактньх нечетких баз знаний типа Мамдани от их полноть. Зксперименть 
проведеньт для зависимостей «2 входа - І вьтход». Предложенная зкспоненциальная модель оценки 
ошибки обучения от полнотьіт базьі знаний. 


5.Д. 5їїоуРба, У. У. МасигенКко 

Вез5еагсі ої Типіпоої Сотрасі Киг/у Матаапі-Туре Кпоу/едсе Вазез 

Тре ргосе85 ої ідепійушя, плиій-Ферепдєпсіез цпеїпеє Г7гу Мападапі-гуре Кпом/едєе Баз5е8 15 іпуезісаїед. ТБія 
рарег ргезепів Ше гебиіїя ої ехрегітепіз оп деїегліпіпе пе дерепаепсе ої їшпіпе, еггог ої сопарасі Магадапі-іуре 
Тагу кпоміедєе Ба5ез оп реїг сопарієїепез8. Ехрегітепіз аге сагтіед опі бог дерепдепсіє5 72 іприїя-І оціриї". Тре 
ехропепна! плодеї ої езштпайоп Бебмееп ігаїпіпе еггогала Фе сопріеїспез5 ої кпом/едєе Базе 15 ргорозей. 
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